تنظیمات خودکار الگوریتم های موازی سطح داده بر روی پردازنده های گرافیکی fermi
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
- نویسنده پانته آ زردشتی
- استاد راهنما فرشاد خونجوش
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
ضرب برداری ماتریس تنک یکی از مهمترین عملیات در محاسبات ماتریس های تنک می باشد که در بسیاری از زمینه های علمی همچون پردازش تصویر، پردازش سیگنال دیجیتال، و معادلات مشتقات جزئی استفاده می شود. فرمت های مختلفی برای ذخیره سازی عناصر غیر صفر در ماتریس های تنک وجود دارد و پیاده سازی های موجود، برای پردازش ماتریس های مختلف تنها از یک فرمت ثابت استفاده می کنند که این عمل منجر به ناکارآمدی عملیات ضرب برداری ماتریس های تنک خواهد شد. چرا که ماتریس های مختلف با توجه به توزیع عناصر صفر در آنها ، ساختارهای متفاوتی دارند.از طرف دیگر، پردازنده های گرافیکی ثابت کرده اند که با استفاده از قدرت محاسباتی خود توانسته اند حجم بالایی از موازات را در بسیاری از برنامه ها فراهم آورند. پیاده سازی هایی که بر پایه این نوع پردازنده ها می باشند بیش از پیاده سازی های دیگر رنج می برند چرا که این نوع پردازنده ها نسبت به تنظیم خودکار حساس تر می باشند . آذرخش نام سیستم ضرب برداری ماتریس های تنک بر پایه پردازنده های گرافیکی ست که ما آن را طراحی و پیاده سازی کردیم.این سیستم با در نظر گرفتن تنظیمات و ویژگی های این پردازنده ها و ماتریس ورودی ، فرمت مناسب را انتخاب خواهد کرد. ما تاثیر پارامترهای متفاوت و تنظیمات آنها را در فرمت های مختلف بر روی کارایی ضرب برداری ماتریس تنک بررسی کردیم و با توجه به اطلاعات بدست آمده محیط انطباقی برای اجرای موثر ضرب برداری ماتریس تنک را طراحی کردیم که برای ماتریس ورودی مناسب ترین فرمت را انتخاب می کند. با توجه به شکل های نشان داده شده ، روش ما، پیاده سازی nvidia را برای ماتریس های یکسان بهبود داده است. همانطورکه از نتایج بدست آمده است، ما توانستیم به طور متوسط کارایی ضرب برداری ماتریس های تنک را در دقت ساده 2.1 برابر و در دقت مضاعف 1.6 برابر بهبود بخشیم.
منابع مشابه
روشی کارا برای پیادهسازی موازی الگوریتم دسته بندی بسته درخت سلسلهمراتبی بر روی واحد پردازش گرافیکی
چکیده: دستهبندی بستهها، پردازشی اساسی در پردازندههای شبکهای است. در این فرآیند، بستههای ورودی از طریق تطبیق با مجموعهای از فیلترها به جریانهای مشخص طبقهبندی میشوند. پیادهسازیهای نرمافزاری الگوریتمهای دستهبندی با وجود هزینه کمتر و توسعهپذیری بیشتر نسبت به پیادهسازیهای سختافزاری، سرعت پایینتری دارند. در این مقاله، از قابلیت پردازش موازی پردازندههای گرافیکی برای تسریع الگوری...
متن کاملارائه الگوریتم جدید توماس شطرنجی برای حل دستگاه معادلات سه قطری روی پردازنده گرافیکی
پردازنده گرافیکی همه منظوره کاربر را قادر می سازد تا از پردازنده گرافیکی برای مقاصد محاسباتی عمومی بهره بگیرد. استفاده از این نوع پردازنده ها موجب افزایش قابل توجهی در سرعت محاسبات عددی می شود. تحقیقات متعددی جهت بررسی مزیت استفاده از پردازنده گرافیکی در محاسبات از جمله بکار گیری آن برای حل دستگاه معادلات سه قطری صورت گرفته است. تمرکز اصلی تحقیقات مذکور، روی ارتقاء شیوه های بهره گیری از الگوریت...
متن کاملشتاب دهی الگوریتم های خوشه بندی با استفاده از مدل برنامه نویسی موازی ترکیبی روی پردازنده های گرافیکی
در دنیای محاسبات مسائل چالش برانگیزی وجود دارند که حل آن ها در زمان معقول و با استفاده از یک پردازنده، دشوار است. با معماری پردازنده های چندهسته ای، زمان اجرای این کاربردها کاهش می یابد. پردازنده های گرافیکی با معماری چندهسته ای موازی، توان پردازشی بسیار بالایی را نسبت به پردازنده های مرکزی ارائه می دهند. این قابلیت موجب گسترش استفاده از آن ها در کاربردهای غیرگرافیکی شده است. توسعه استفاده از پ...
15 صفحه اولپیاده سازی روش گرادیان مزدوج با کارایی بالا به کمک زبان آزاد محاسباتی روی پردازنده های گرافیکی
متن کامل
طراحی و پیاده سازی سامانه ای برای پردازش بزرگ داده ها بر روی پردازنده های گرافیکی
پردازنده های گرافیکی از تعداد زیادی هسته پردازشی بهره می برند که مجموعاً از قدرت پردازشی بیشتری نسبت به پردازنده مرکزی برخوردارند. معماری خاص این پردازنده ها و قدرتشان ا?نها را برای پردازش بزرگ داده ها مناسب کرده است. اما نوشتن برنامه ای که به شکل مناسبی از این قدرت استفاده کند کار چندان ساده ای نیست. محدودیت حافظه پردازنده های گرافیکی و جدا بودن ا?ن این کار را برای پردازش بزرگ داده ها دشوارتر ن...
منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023